Wprowadzenie

Cel badania

Celem niniejszego projektu jest zbadanie wielowymiarowych zależności między spożyciem alkoholu, towarzyszącym mu stylem życia a wynikami w nauce (GPA) oraz funkcjonowaniem poznawczym studentów uniwersyteckich. Problem ten jest istotny ze względu na powszechność kultury picia w środowisku akademickim i jej potencjalnie negatywny wpływ na karierę edukacyjną. Analiza opiera się na danych ankietowych obejmujących zmienne demograficzne, ekonomiczne (stypendia, zakwaterowanie), społeczne (relacje z rodzicami) oraz behawioralne (częstotliwość imprezowania, absencja na zajęciach). W toku prac dane poddano czyszczeniu oraz imputacji, aby zapewnić rzetelność wnioskowania statystycznego.

Pytania badawcze

W ramach analizy postawiono następujące pytania badawcze:

  1. Bezpośredni wpływ alkoholu na wyniki: Czy istnieje istotna statystycznie, ujemna korelacja między ilością spożywanego alkoholu a średnią ocen (GPA)?
  2. Rola statusu ekonomicznego: Czy wyższy dochód rozporządalny (allowance) stymuluje intensywniejsze życie towarzyskie, pośrednio wpływając na obniżenie wyników w nauce?
  3. Środowisko zamieszkania a kultura studencka: Czy rodzaj zakwaterowania różnicuje siłę związku między spożyciem alkoholu a liczbą opuszczonych zajęć?
  4. Psychospołeczne determinanty: Czy jakość relacji z rodzicami oraz ich aprobata dla spożywania alkoholu stanowią istotne predyktory ryzykownych zachowań studentów?
  5. Efekt kompensacji: Czy zwiększony nakład pracy własnej (dodatkowe godziny nauki w tygodniu) jest w stanie zniwelować negatywny wpływ “imprezowego stylu życia” na średnią ocen?
  6. Ryzyko akademickie: W jakim stopniu “imprezowy styl życia” zwiększa ryzyko niezdania przedmiotów?
  7. Różnice międzypłciowe (Gender Gap): Czy płeć studenta różnicuje wzorce spożycia alkoholu i jego wpływ na oceny?

Czyszczenie danych

W tym etapie surowe dane ankietowe zostały poddane standaryzacji i transformacji, aby umożliwić ich dalszą analizę statystyczną. Wykonano następujące operacje:

  • Selekcja i nazewnictwo: Usunięto zbędne kolumny (np. znaczniki czasowe) oraz nadano zmiennym intuicyjne nazwy (np. sex, grade_12, drinks), zastępując długie pytania z kwestionariusza (Tabela 1).
  • Kodyfikacja zmiennych:
    • Zmienne binarne (np. płeć, stypendium) przekodowano na format 0-1.
    • Zmienne opisowe (np. przedziały dochodów, liczba drinków) zamieniono na skalę porządkową, co pozwoli na zachowanie hierarchii danych w modelach korelacji.
  • Logika dla pierwszego roku: Zidentyfikowano specyficzną grupę studentów pierwszego roku (“12th class”). Ich braki danych w kolumnie ocen z poprzedniego roku akademickiego (grade_last_y) nie są błędem, lecz wynikają ze struktury badania (brak historii studiowania). Zostało to uwzględnione w procesie imputacji.
  • Walidacja danych: Przeprowadzono weryfikację reguł logicznych (np. czy wartości ocen mieszczą się w przedziale 0-100%), wykorzystując pakiet validate.
  • Duplikaty: Zidentyfikowano 2 duplikaty, jednak ze względu na specyfikę ankiety uznano je za możliwe zbiegi okoliczności (identyczne odpowiedzi różnych osób) i pozostawiono w zbiorze.
Tabela 1: Słownik zmiennych
Nazwa zmiennej Opis zmiennej
sex Płeć respondenta
grade_12 Średnia ocen z 12 klasy (GPA)
last_year Rok studiów w roku 2023
faculty Kierunek studiów
grade_last_y Średnia ocen za rok akademicki 2023
accomodation Status zakwaterowania (prywatne vs publiczne)
allowance Miesięczny budżet
scholarship Czy student posiadał stypendium
studying Dodatkowe godziny nauki tygodniowo
partying Częstotliwość wychodzenia na imprezy
drinks Liczba drinków spożywanych jednej nocy
classes_missed Liczba zajęć opuszczonych przez alkohol
modules_failed Liczba niezdanych przedmiotów
relationship Czy student jest w związku
parents_alcohol_approval Czy rodzice akceptują spożywanie alkoholu
relationship_w_parents Relacja z rodzicami

Analiza i diagnoza braków danych

Przed przystąpieniem do uzupełniania danych, przeprowadzono wizualną inspekcję brakujących wartości przy użyciu pakietów naniar i ggmice. Pozwoliło to na podjęcie kluczowych decyzji:

  1. Eliminacja rekordów: Usunięto obserwacje posiadające braki w kluczowych zmiennych strukturalnych: sex (płeć), faculty (wydział) oraz last_year (rok studiów). Zmienne te definiują profil studenta i są trudne do wiarygodnego odtworzenia metodami statystycznymi.
  2. Identyfikacja mechanizmu braków: Potwierdzono, że część braków ma charakter strukturalny (np. brak ocen z poprzedniego roku dla studentów pierwszego roku), co wyklucza prostą imputację średnią dla całej populacji.

Imputacja danych

Pozostałe braki danych (w zmiennych takich jak allowance, scholarship czy grades) uzupełniono, wykorzystując algorytm k-Nearest Neighbors (kNN). Metoda ta polega na znalezieniu dla każdej niepełnej obserwacji grupy najbardziej podobnych do niej studentów (“sąsiadów”) i uzupełnieniu braku na podstawie ich danych.

Dobór parametru \(k=5\):

Decyzja o wyborze 5 sąsiadów wynika z konieczności zachowania równowagi między wariancją a obciążeniem estymatora:

  • Ryzyko zbyt małego k - Wysoka wariancja: Przy zbyt małej liczbie sąsiadów imputacja jest niestabilna i nadmiernie wrażliwa na pojedyncze wartości odstające (szum w danych).
  • Ryzyko zbyt dużego k - Wysokie obciążenie: Zbyt duża liczba sąsiadów prowadzi do nadmiernego uśredniania (“wygładzania”), co zaciera lokalne, specyficzne struktury danych.
  • Optimum: Wartość \(k=5\) jest bezpiecznym kompromisem, pozwalającym na stabilną predykcję przy zachowaniu zmienności populacji.

Dla zmiennej grade_last_y zastosowano podejście hybrydowe: imputacja została skorygowana logicznie dla studentów pierwszego roku, aby nie przypisywać im ocen z okresu, gdy jeszcze nie studiowali. Zmienne czysto osobiste (relationship, parents_alcohol_approval oraz relationship_w_parents) pozostawiono bez zmian ze względu na ryzyko błędu predykcji.

Weryfikacja jakości imputacji

W celu potwierdzenia poprawności działania algorytmu wygenerowano wykresy dla zmiennych allowance oraz accommodation, które (poza ocenami strukturalnymi) posiadały największy odsetek braków (>5%).

Zestawienie tych kategorii ze zmienną grade_12 pokazuje, że wartości uzupełnione (oznaczone kolorem czerwonym) naturalnie wpisują się w rozkład danych oryginalnych. Brak nienaturalnych skupisk punktów imputowanych potwierdza, że proces ten nie wprowadził istotnych zniekształceń do struktury zbioru danych.

Wizualizacja danych

Analiza Archetypów Studenckich (PCA + k-means)

W celu identyfikacji wzorców zachowań w populacji studenckiej zastosowano analizę skupień (algorytm k-means) wspartą redukcją wymiarowości (PCA). Pozwoliło to na rzutowanie wielowymiarowych danych na płaszczyznę 2D i wyodrębnienie trzech głównych profili studentów.

Interpretacja wykresu:

Wykres przedstawia przestrzeń zachowań studentów rozpiętą na dwóch głównych wymiarach (składowych głównych):

  1. Oś X (Wymiar 1 - Styl Życia): Odpowiada głównie za intensywność życia towarzyskiego. Im dalej w prawo, tym częstsze imprezy i wyższe spożycie alkoholu.
  2. Oś Y (Wymiar 2 - Wyniki): Koreluje z efektywnością akademicką. Im wyżej, tym wyższe oceny i większy nakład pracy własnej.

Zidentyfikowane grupy:

  • Imprezowicz (Czerwony): Grupa dominująca w prawej części wykresu. Charakteryzuje się wysoką aktywnością towarzyską, co często wiąże się z niższymi wynikami w nauce (ujemna korelacja).
  • Prymus (Niebieski): Skupiony w górnej części wykresu. Studenci ci poświęcają najwięcej czasu na naukę i osiągają najwyższe średnie (GPA), kosztem ograniczonego życia towarzyskiego.
  • Przeciętniak (Zielony): Grupa środkowa, balansująca między dwiema skrajnościami. Stanowi ona “bufor” i reprezentuje studentów starających się godzić umiarkowane rozrywki z akceptowalnymi wynikami.

Wpływ statusu ekonomicznego na styl życia i wyniki

W tej sekcji poddano weryfikacji pytanie badawcze: czy wyższy dochód rozporządzalny stymuluje intensywniejsze życie towarzyskie?

Metodologia i wskaźniki

Aby umożliwić obiektywne porównanie grup, wprowadzono dwa parametry analityczne:

  • Podział budżetu: Próbę badawczą podzielono na dwa segmenty względem miesięcznego kieszonkowego:
    • Niższy budżet: \(\le 5000\) R.
    • Wyższy budżet: \(> 5000\) R.
  • Indeks Towarzyski: Stworzono zagregowany wskaźnik (skala 0–13 pkt), będący sumą punktów za:
    • Częstotliwość imprezowania (partying): 0–4 pkt (w tym wartość 1.5 dla “Only weekends”).
    • Ilość spożywanego alkoholu (drinks): 0–9 pkt.
    • Wskaźnik ten obrazuje całkowitą intensywność stylu życia studenta.

Interpretacja mapy gęstości

Wizualizacja wykorzystuje metodę estymacji gęstości jądrowej (2D Kernel Density). Skala kolorystyczna wskazuje na stopień koncentracji obserwacji w danej przestrzeni.

Kluczowe wnioski

  1. Pieniądze jako stymulant: W grupie z wyższym budżetem „ośrodek ciężkości” (żółty obszar) wyraźnie przesuwa się w prawą stronę osi X. Potwierdza to, że większe zasoby finansowe ułatwiają dostęp do płatnych rozrywek i sprzyjają częstszej konsumpcji alkoholu.
  2. Zwiększone ryzyko akademickie: Choć w obu grupach najwyższe oceny korelują z niską intensywnością imprezowania, grupa zasobna wykazuje znacznie większe rozproszone w stronę wysokiej intensywności towarzyskiej. Sugeruje to, że nadmiar środków sprzyja przedkładaniu zabawy nad obowiązki.
  3. Dyscyplina niższych dochodów: Studenci z niższym budżetem wykazują silniejszą koncentrację w obszarze umiarkowanego życia towarzyskiego, co przekłada się na statystycznie stabilniejsze i bardziej przewidywalne wyniki w nauce.

Podsumowanie: Wyższy status ekonomiczny działa jako katalizator życia towarzyskiego. Zwiększając dostępność kosztownych rozrywek, staje się on pośrednim czynnikiem ryzyka dla wyników akademickich poprzez wyraźną zmianę priorytetów czasowych studenta.

Środowisko zamieszkania a kultura studencka

W tej części analizy sprawdzono, czy rodzaj zakwaterowania (akademik vs. mieszkanie prywatne) moderuje związek między spożyciem alkoholu a absencją na zajęciach. Weryfikujemy hipotezę, czy “kontrola społeczna” w akademikach lub większa swoboda w mieszkaniach prywatnych wpływają na dyscyplinę studentów.

Interpretacja wyników

Powyższa wizualizacja pozwala ocenić siłę związku między piciem a opuszczaniem zajęć w dwóch różnych środowiskach:

  • Nachylenie linii trendu (Regresja): Kąt nachylenia linii jest kluczowym wskaźnikiem wrażliwości. Im bardziej stroma linia, tym silniejsza jest negatywna korelacja – oznacza to, że w danej grupie każdy dodatkowy drink skutkuje gwałtowniejszym wzrostem liczby opuszczonych godzin.
  • Rozkład obserwacji (Jitter): Zastosowanie techniki jitter (lekkiego przesunięcia punktów) ujawnia rzeczywiste zagęszczenie danych. Pozwala to zauważyć, że choć średnie mogą być zbliżone, ekstrema (osoby pijące bardzo dużo i opuszczające mnóstwo zajęć) mogą częściej występować w jednej ze specyficznych grup.
  • Wniosek analityczny: Porównanie obu paneli pozwala zweryfikować, czy mieszkanie w akademiku działa jak czynnik intensyfikujący zachowania rozrywkowe (ze względu na presję grupy), czy może to prywatne mieszkanie sprzyja większym zaniedbaniom w nauce poprzez brak zewnętrznej kontroli.

Analiza efektu kompensacji

Wykres trójwymiarowy służy do weryfikacji hipotezy kompensacji. Badamy interakcję trzech zmiennych jednocześnie: intensywności życia towarzyskiego (oś X), nakładu pracy własnej (oś Y) oraz wyników w nauce (oś Z). Szukamy odpowiedzi na kluczowe pytanie: czy dodatkowe godziny nauki są w stanie zneutralizować negatywny wpływ intensywnego imprezowania na średnią ocen (GPA)?

Interpretacja modelu 3D

Analiza przestrzenna pozwala na sformułowanie następujących spostrzeżeń dotyczących strategii studentów:

  • Strefa sukcesu (Kolor żółty): Najwyższe wyniki (szczyt osi Z) koncentrują się w obszarze, gdzie wysoki nakład nauki spotyka się z niską lub umiarkowaną intensywnością imprez.
  • Granice kompensacji: Choć zwiększenie liczby godzin nauki (przesunięcie wzdłuż osi Y) pozytywnie wpływa na wynik, nie jest w stanie w pełni zniwelować skutków ekstremalnego imprezowania. W rogu wykresu odpowiadającym maksymalnej rozrywce – nawet przy dużej ilości nauki – dominują kolory ciemniejsze (niższe oceny).
  • Wniosek analityczny: Model sugeruje występowanie prawa malejących przychodów. Dodatkowa nauka jest skuteczna, ale przy bardzo intensywnym życiu towarzyskim jej efektywność drastycznie spada – prawdopodobnie ze względu na obniżoną koncentrację i kondycję psychofizyczną, której nie da się po prostu “zauczyć”.

Różnice międzypłciowe

Analiza wpływu alkoholu na wyniki byłaby niepełna bez uwzględnienia czynników demograficznych. Poniższy wykres weryfikuje, czy płeć studenta różnicuje odporność na akademickie skutki życia towarzyskiego oraz czy dynamika spadku ocen jest uniwersalna dla obu grup.

Interpretacja wyników

Wizualizacja ta jest złożona, ponieważ łączy analizę średnich (linie) z pełnym rozkładem danych (wykresy skrzypcowe w tle).

  • Zbieżność trendów: Obie linie trendu wykazują wyraźną tendencję spadkową. Oznacza to, że niezależnie od płci, zwiększona konsumpcja alkoholu koreluje z obniżeniem wyników w nauce.
  • Analiza dystrybucji (Skrzypce): Tło wykresu pokazuje, że w grupach o wysokim spożyciu (“5-8” oraz “8+”) rozrzut wyników jest znacznie większy. Oznacza to, że choć średnia spada, zdarzają się jednostki (wąskie “szczyty” skrzypiec), które mimo imprezowania utrzymują wysokie oceny – jednak jest to margines błędu statystycznego.
  • Wniosek końcowy: Płeć nie jest silnym moderatorem tej zależności. Krzywe dla kobiet i mężczyzn przebiegają niemal równolegle, co sugeruje, że mechanizm negatywnego wpływu alkoholu na zdolności kognitywne jest uniwersalny i niezależny od płci biologicznej.

Analiza opisowa

Statystyki opisowe wyników akademickich (GPA)

Statystyki opisowe wyników akademickich (GPA)
N Średnia Mediana Odchylenie Minimum Maksimum
398 68.4 68 9.98 30 96

Rozkład wyników akademickich (GPA)

Przeprowadzona analiza statystyczna zmiennej charakteryzującej wyniki w nauce (GPA) na próbie \(N = 398\) studentów pozwala na sformułowanie następujących wniosków dotyczących struktury osiągnięć akademickich badanej populacji:

1. Przeciętny poziom i typowy wynik Rozkład ocen przypomina klasyczną krzywą Gaussa (rozkład normalny), co jest sytuacją pożądaną w statystyce. Potwierdza to fakt, że średnia ocena (\(\bar{x} = 68.4\%\)) jest niemal identyczna jak mediana (\(Me = 68\%\)). Taka zbieżność oznacza, że grupa jest symetryczna – nie ma tu wyraźnej przewagi osób z wynikami bardzo niskimi ani bardzo wysokimi. Najwięcej studentów (tzw. dominanta) uzyskuje wyniki w przedziale 70–75%, co wskazuje, że standardem w badanej grupie jest poziom “dobry”.

2. Zróżnicowanie wyników (Dyspersja) Wartość odchylenia standardowego (\(SD = 9.98\)) świadczy o umiarkowanym zróżnicowaniu wyników. W praktyce oznacza to, że większość badanej grupy (ok. 68% studentów) mieści się w przedziale wyników od ok. 58% do 78%. Sugeruje to, że poziom wiedzy studentów jest stosunkowo wyrównany, choć oczywiście występują naturalne różnice indywidualne.

3. Rozpiętość osiągnięć Mimo koncentracji wyników wokół średniej, w grupie występuje pełne spektrum osiągnięć (rozstęp wynosi 66 punktów procentowych). Najniższy zanotowany wynik to 30%, a najwyższy 96%. Wskazuje to na obecność w badanej grupie zarówno nielicznych osób zagrożonych niezaliczeniem (widocznych na wykresie jako pojedyncze przypadki poniżej 40%), jak i studentów wybitnych. Są to jednak wyjątki na tle całej populacji.

Podsumowanie: Zmienna GPA posiada pożądane właściwości statystyczne (bliskość rozkładu normalnego, brak drastycznych asymetrii), co czyni ją wiarygodnym wskaźnikiem do dalszych analiz korelacyjnych, np. w kontekście badania wpływu konsumpcji alkoholu na efektywność akademicką.

Porównanie wyników kobiet i mężczyzn

Zastosowanie wizualizacji typu Raincloud Plot łączącej estymator gęstości jądrowej, wykres pudełkowy oraz surowe dane punktowe pozwala na wielowymiarową ocenę zależności między płcią a efektywnością kształcenia.

Analiza porównawcza struktury ocen w podziale na płeć

1. Przeciętny poziom wyników (Mediana) Analiza środkowych wartości na wykresach pokazuje, że przeciętny poziom ocen jest niemal identyczny dla obu płci. Zarówno kobiety, jak i mężczyźni osiągają medianę wyników w okolicach 68%. Oznacza to, że w badanej grupie płeć nie determinuje tego, czy ktoś uczy się przeciętnie lepiej, czy gorzej.

2. Kształt rozkładu ocen Krzywe widoczne nad wykresami mają bardzo zbliżony kształt dla obu grup. Wskazuje to, że struktura ocen jest analogiczna, zarówno wśród kobiet, jak i mężczyzn najliczniejsze grupy studentów uzyskują podobne wyniki. Nie widać tutaj zjawiska, w którym jedna z płci dominowałaby wyraźnie w grupie najlepszych lub najsłabszych studentów.

3. Zróżnicowanie i rozpiętość wyników Rozrzut punktów pod wykresem pokazuje, że w obu grupach występują bardzo zróżnicowane postawy. Zarówno wśród kobiet, jak i mężczyzn znajdziemy osoby z wynikami bardzo wysokimi, jak i pojedyncze przypadki wyników skrajnie niskich (poniżej 40%). Zakres zmienności jest porównywalny, co potwierdza, że poziom zróżnicowania wiedzy jest niezależny od płci.

Pdsumowanie: Na podstawie analizy wizualnej można postawić hipotezę o braku istotnego statystycznie związku między płcią a wynikami GPA w badanej kohorcie. Ewentualne różnice są subtelne i prawdopodobnie nie mają znaczenia praktycznego.

Profil studenta w kontekście statusu stypendialnego

NIESTYPENDYŚCI

STYPENDYŚCI

Cecha

Mean / N

SD / %

Mean / N

SD / %

Liczba obserwacji (N)

353

45

Średnia ocen (GPA)

68.48

10.17

67.78

8.38

PŁEĆ

Kobieta

164

46.5

18

40

Mężczyzna

189

53.5

27

60

CZAS NAUKI [h]

0

20

5.7

0

0

1-3

74

21

8

17.8

3-5

91

25.8

13

28.9

5-8

71

20.1

8

17.8

8+

97

27.5

16

35.6

IMPREZOWANIE/TYDZIEŃ

0

13

3.7

4

8.9

1 raz

97

27.5

11

24.4

Tylko weekendy

94

26.6

16

35.6

2 razy

76

21.5

9

20

3 razy

57

16.1

5

11.1

4+ razy

16

4.5

0

0

Analiza opisowa według stypendium

1. Charakterystyka osiągnięć akademickich (GPA) Dane wskazują na dużą spójność obu grup w zakresie wyników nauczania. Średnia ocen (GPA) niestypendystów (68,48) jest niemal identyczna z wynikiem stypendystów (67,78). Sugeruje to, że w badanej populacji status stypendialny nie zależy wyłącznie od ocen, co może wskazywać na istotną rolę kryteriów socjalnych w procesie przyznawania wsparcia finansowego.

2. Struktura demograficzna i reprezentacja płci Wyniki ujawniają wyraźną różnicę w rozkładzie płci wśród osób otrzymujących pomoc finansową. W grupie stypendystów odnotowano znaczną przewagę mężczyzn (60%), podczas gdy u niestypendystów podział ten jest bardziej wyrównany (53,5% vs 46,5%). Taka struktura może wynikać ze specyfiki sytuacji materialnej badanych grup lub uwarunkowań systemowych na danym wydziale.

3. Inwestycja czasu w samokształcenie: Nauka Stypendyści wykazują wyższą dyscyplinę i większy nakład pracy własnej. W tej grupie nikt nie zadeklarował braku nauki (0% vs 5,7% u niestypendystów), a ponad 35% osób uczy się powyżej 8 godzin tygodniowo. Świadczy to o silnej motywacji stypendystów do utrzymania dobrych wyników i dbałości o status studenta.

4. Styl życia i organizacja czasu: Imprezowanie Sposób spędzania czasu wolnego przez stypendystów wskazuje na efektywne zarządzanie czasem. Znacznie częściej wybierają oni model odpoczynku skumulowany w weekendy (35,6% vs 26,6%), co pozwala im na pełną koncentrację na obowiązkach akademickich w ciągu tygodnia roboczego.

Podsumowanie: Profil stypendysty wyłaniający się z danych to profil studenta o wysokiej dyscyplinie pracy i umiejętności optymalizacji czasu wolnego. Choć średnie oceny obu grup są porównywalne, stypendyści wyróżniają się większym zaangażowaniem w naukę własną oraz bardziej ustrukturyzowanym stylem życia, co sprzyja stabilności ich wyników akademickich.

Typologia zachowań związanych ze spożyciem alkoholu

Analiza struktury spożycia ujawnia dominujący “styl picia” w badanej grupie. Ilustracja obrazuje deklarowaną liczbę drinków spożywanych podczas pojedynczego wyjścia towarzyskiego. \(N = 398\)

Wzorce konsumpcji alkoholu “Intensywność”

1. Analiza struktury spożycia alkoholu Wizualizacja danych wskazuje na znaczące zróżnicowanie w postawach studentów wobec alkoholu. Najliczniejszą grupę stanowią osoby o wysokim poziomie konsumpcji (5-8 jednostek), które obejmują 28% badanej populacji (110 osób). Sugeruje to, że dominującym modelem w grupie badawczej jest spożycie o charakterze intensywnym.

2. Skala zjawisk skrajnych: Abstynencja vs Ryzyko Zjawisko całkowitej abstynencji ma charakter niszowy i dotyczy jedynie 7% respondentów (26 osób). Na drugim biegunie znajduje się grupa wykazująca ryzykowne wzorce spożycia (8+ jednostek), która jest liczna i obejmuje aż 22% badanych (86 osób).

3. Charakterystyka spożycia umiarkowanego i symbolicznego Grupy deklarujące spożycie symboliczne (1-3 jednostki) oraz umiarkowane (3-5 jednostek) reprezentują po 22% udziału w próbie (odpowiednio 89 i 87 osób). Sumarycznie blisko połowa badanych utrzymuje się w przedziale niskiego i średniego spożycia, co wskazuje na wyraźną polaryzację postaw między studentami zachowującymi kontrolę nad konsumpcją a grupą pijącą intensywnie.

4. Tendencje ogólne i profil grupy Łączny udział osób pijących powyżej 5 jednostek (kategorie wysoka i ryzykowna) wynosi aż 50% całej populacji badawczej. Wynik ten jest istotny z punktu widzenia higieny trybu życia i może korelować z innymi zachowaniami zdrowotnymi oraz wynikami akademickimi, które były analizowane we wcześniejszych sekcjach raportu.

Podsumowanie: Dane przedstawione na piktogramie ukazują model konsumpcji o wysokim stopniu intensywności. Dominacja grup o spożyciu wysokim i ryzykownym (łącznie połowa badanych) przy marginalnym odsetku abstynentów świadczy o szerokiej akceptacji społecznej dla częstego i obfitego spożywania alkoholu w badanej grupie studenckiej.

Analiza korelacji

Wpływ alkoholu na wyniki w nauce

W celu sprawdzenia zależności między ilością spożywanego alkoholu a średnią ocen (GPA), przeprowadzono analizę korelacji rangowej Spearmana.

Wyniki analizy

  • Współczynnik korelacji (\(\rho\)): -0.086
  • Poziom istotności (\(p\)): < 0.001

Interpretacja statystyczna: Analiza wykazała istotną statystycznie (\(p < 0.001\)), lecz bardzo słabą ujemną korelację.

Wnioski

  1. Pewność wyniku (Istotność): Bardzo niska wartość \(p\) (< 0.001) potwierdza, że ujemny wynik nie jest dziełem przypadku. W badanej populacji rzeczywiście istnieje tendencja: osoby pijące więcej mają statystycznie niższe oceny, jednak jest to zależność bardzo delikatna.
  2. Siła efektu (Wielkość): Współczynnik \(\rho = -0.086\) oznacza korelację śladową. Ilość wypitego alkoholu wyjaśnia mniej niż 1% zmienności wyników w nauce. W praktyce oznacza to, że znając tylko ilość spożywanego przez studenta alkoholu, nie jesteśmy w stanie przewidzieć jego ocen.
  3. Mechanizmy kompensacyjne: Tak słaby związek sugeruje, że studenci skutecznie oddzielają życie towarzyskie od nauki. Ewentualny negatywny wpływ alkoholu jest prawdopodobnie niwelowany przez inne czynniki (np. nadrabianie zaległości w dni bez imprez) lub ujawnia się dopiero przy skrajnym spożyciu, które w tej próbie stanowi mniejszość.

Podsumowanie: Hipoteza o negatywnym wpływie alkoholu na oceny została potwierdzona statystycznie, jednak siła tego oddziaływania jest marginalna. Samo spożycie alkoholu nie jest głównym wyznacznikiem sukcesu akademickiego – kluczowe wydają się inne czynniki

Uporządkowany model logitowy

Wyniki porządkowego modelu logitowego
Czynnik OR Dolna gr. Górna gr. p-value
Częstotliwość imprezowania 0.69 0.55 0.86 0.001
Opuszczanie zajęć 1.23 1.01 1.49 0.040

Metodologia

Zastosowana metoda: Regresja Logistyczna dla Zmiennych Porządkowych.

W celu zbadania czynników wpływających na skalę niepowodzeń akademickich, zastosowano model proporcjonalnych szans. Jest to specyficzny rodzaj regresji, dedykowany do analizy zmiennych, które posiadają naturalny porządek, ale nie są liczbami ciągłymi. Zostosowano następujące uporządkowanie: Brak niezdanych przedmiotów < 1 niezdany < 2 niezdane < 3 niezdane.

Interpretacje i wnioski

Opuszczanie zajęć: Zmienna ta jest istotnym statystycznie czynnikiem ryzyka. Każdy wzrost częstotliwości opuszczania zajęć o jeden poziom wiąże się ze wzrostem szansy na gorszy wynik egzaminacyjny (tj. oblanie większej liczby przedmiotów) o 23%.

Częstotliwość imprezowania: Wynik ten jest wysoce istotny i wskazuje na silną, odwrotną zależność. Wartość OR poniżej 1.0 oznacza, że wyższa aktywność towarzyska (przy stałym poziomie nieobecności) wiąże się ze spadkiem ryzyka porażki. Konkretnie, wyższy poziom aktywności towarzyskiej obniża szansę na niepowodzenie o około 31%.

Wniosek: Wynik ten sugeruje, że życie towarzyskie może pełnić funkcję “bufora stresu” lub sprzyjać budowaniu kapitału społecznego (wspólna nauka, wymiana notatek). Studenci aktywni towarzysko radzą sobie lepiej niż osoby izolujące się, pod warunkiem, że imprezowanie nie prowadzi do opuszczania zajęć.

Interpretacja: Metoda łokcia wskazuje na punkt “zagięcia” krzywej przy wartości k = 3. Oznacza to, że po wyodrębnieniu trzech grup, dalsze rozdrabnianie populacji nie przynosi istotnego wzrostu jakości dopasowania. Sugeruje to istnienie trzech głównych archetypów zachowań wśród badanych studentów.

Wnioskowanie statystyczne

Sprawdzamy, czy środowisko akademika sprzyja gorszemu GPA w porównaniu do mieszkania prywatnego. Została zbadana różnica w wynikach w ostatnim roku dla studentów, którzy są teraz przynajmniej na 2 roku.

Wyniki testu niezależności Chi-kwadrat
Statystyka Chi² Stopnie swobody (df) Wartość p Metoda
16.06 4 0.003 Pearson’s Chi-squared test

Tabela 1: Wyniki analizy kowariancji (ANCOVA)
Czynnik Suma kwadratów df Statystyka F p.value Wartość p
study_num 8.6 1 0.09 0.7689417 0.769
faculty 938.4 7 1.35 0.2251489 0.225